Quiz 4.mars. Multippel og logistisk regresjon

Vi jobber videre med stressdata fila fra slides som er hentet fra denne studien

Er dette et tverrsnitts- eller longitudinelt datasett?
Er utvalget tilfeldig? Hvordan vil du karakterisere utvalget?
Hva er standardavviket til alder i datasettet?
Hvordan vil du definere en “uvanlig” høy alder?
Lag et 95\% konfidensintervall for alder.

t.test(stressdata$age)

Det påstås at i populasjonen som dette utvalget er tatt ifra så er menn og kvinner like gamle. Skriv opp nullhypotesen og alternativhypotesen. Bruk symbolene \(\mu_M\) og \(\mu_K\).
Utfør testen ved hjelp av

t.test(age~kjønn, stressdata)

Gå til artikkelen og last ned “supplemental data” dokumentet. Der finner du spørsmålene om Usikkerhet: INSE1-INSE5. Lag et spredningsplott av INSE1 vs INSE2 og forklar hvorfor det ikke er informativt

plot(stressdata$INSE1, stressdata$INSE2)

Du kan “jittre” observasjonene ved hjelp av ggplot2 pakken i tidyverset.

qplot(stressdata$INSE1, stressdata$INSE2)+geom_jitter()

Legg til regresjonslinja ved hjelp av +geom_smooth(method=“lm”) i kommandoen over. Er det negativ, ingen, eller positiv sammenheng mellom INSE1 og INSE2?

Beregn korrelasjonen mellom INSE1 og INSE2 vha cor() funksjonen
Lag summescore for alle 5 INSE items, som en ny variabel:

stressdata$insecurity <- stressdata$INSE1+stressdata$INSE2+stressdata$INSE3+stressdata$INSE4+stressdata$INSE5

Kjør en regresjon med summescore for insecurity som avhengig variabel og kjønn og alder som prediktorer. Hva blir \(R^2\) adjusted?

mod <- lm(insecurity ~ kjønn+age, data=stressdata) 
summary(mod)

Har modellen noen som helst forklaringskraft?

Kjør en regresjon med summescore for insecurity som avhengig variabel og bransje som prediktor. Har denne modellen noen som helst forklaringskraft?

mod <- lm(insecurity ~ bransje, data=stressdata) 
summary(mod)

Har modellen noen som helst forklaringskraft?

Tolk Intercept verdien i modellen i oppgave 12.
Tolk regresjonskoeffisient for bransje:Helse og Omsorg, i oppgave 12.
Ta med summescoren complexity for COMP1-COMP5 som en prediktor i tillegg til bransje. Har denne modellen bedre forklaringskraft enn modellen i oppgave 12?
Tolk regresjonskoeffisienten til complexity.
Hvilken insecurity score forventer vi for en person som skåret 10 på complexity skalaen dersom denne personen jobber i Helse og omsorg?
Lag korrelasjonsmatrisen for alle INSE items og insecurity

inse <- select(stressdata, contains("INSE"))
cor(inse) %>% round(2)

Hvilket item er minst korrelert med summeskåren?

Beregn cronbach’s \(\alpha\) for INSE

psych::alpha(inse[, 1:5])

Hva blir \(\alpha\) hvis vi fjerne det itement fra skalaen som er minst korrelert med summeskåren?

I utgangspunktet fra den tyske originalstudien skulle det være 10 fasetter av digitalt jobbstress. Studien vår finner ikke støtte for dette. Vi fant støtte for 8 fasetter. Hvilke to fasetter av digital jobbstress fant vi ikke støtte for i det norske utvalget?
Logistisk regresjon. Bruk stressdataene til å predikere kjønn ut ifra bransje og leder (to binære prediktorer). Du må gjøre kjønn om til 0/1 (1 =kvinne) først:

stressdata$kvinne <- ifelse(stressdata$kjønn=="mann", 0, 1)

Tolk koeffisientene i forrige oppgave, gjerne som prosentvis endring i oddsene
Noen kjente tester er

Eysenck and Eysenck (1968) Personality Inventory
Spielberger (1983) State trait anxiety scale
Rotter (1966) locus of control
Rosenberg (1965) self-esteem

Hvor mange items er det i hvert av disse? Hvilken Likert skala er brukt?

References

Eysenck, Hans J, and Sybil BG Eysenck. 1968. “Eysenck Personality Inventory.” Journal of Clinical Psychology.

Rosenberg, Morris. 1965. “Rosenberg Self-Esteem Scale.” Journal of Religion and Health.

Rotter, Julian B. 1966. “Generalized Expectancies for Internal Versus External Control of Reinforcement.” Psychological Monographs: General and Applied 80 (1): 1.

Spielberger, Charles D. 1983. “State-Trait Anxiety Inventory for Adults.”